第五届Stata编程技术培训暨技术研讨会圆满结束
爬虫俱乐部携雪晴数据网、友万科技举办的“爬虫俱乐部第五届Stata编程技术训练营”2017年北京专场于4月16日在北京理工大学圆满落幕。北京的热情似火并没有影响大家学习的热情,为期三天的培训让大家收获满满。现场有来自北京大学、中国人民大学、天津大学、北京理工大学、中央财经大学、中南财经政法大学、吉林大学、武汉大学、对外经济贸易大学、湖南第一师范学院、山东财经大学、中国石油大学、河南大学、北京师范大学、华中师范大学、中山大学、首都经济贸易大学等四十多名教师和学者一起参与了本次会议。
本次会议内容秉承由简入深、删繁就简的原则,课程主要的内容覆盖了多种复杂数据的读取、各种数据整理的技巧、源代码脚本的快速处理、简单网络爬虫工具、利用正则表达式的文本处理技术和利用正则表达式的网络爬虫技术等实用技术。通过具体的案例对每部分技术进行讲解,使大家能够快速的掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。通过本次培训,让大家对STATA软件编程技术有了更深入的认识,并在其工作岗位上发挥其强大的功能。
会议第一天第二天由李春涛教授讲解Stata基础与DOS命令介绍、数据的读入、局部宏与全局宏的定义、宏扩展函数应用、系统常量的访问、循环格式、copy命令、post命令、以及回归与结果输出等。
并通过用Stata整理CSSCI期刊目录、股价同步性与事件研究等案例来展示这些技术的运用方法。
他还通过对上市公司公告的抓取、NBER工作论文的下载等案例讲解了Stata网络爬虫技术的整体思路,以及对网络信息与数据的抓取和抓取之后处理信息与数据的方法。
第三天,由薛原先生介绍了Stata中与正则表达式相关的字符串函数、元字符与匹配模式,并通过几个案例介绍了正则表达式在词频统计、网络爬虫中的运用。
在会议期间,会务组一如既往地安排了参会嘉宾现场操作与交流答疑环节,并提供了丰富的午餐及交流晚宴,让大家在学习的同时为所有喜爱STATA软件的专业人士搭建起沟通的桥梁。
在热烈的掌声中,培训课程圆满结束。感谢爬虫团队提供丰富的培训内容;感谢李春涛教授和薛原老师的精彩讲解;感谢参会学员对我们工作的支持和理解;感谢北京理工大学大数据创新学习中心、友万科技和雪晴数据网对本次会议的大力支持。
为了保证培训课程质量,我们一直控制会议的规模,参会人数有限,导致有些老师和学者没有参加此次培训,请大家继续关注雪晴数据网;继续关注爬虫俱乐部(微信公众号)。今后我们将定期举办R、Python、Stata软件在网络爬虫及数据统计分析方面技能等培训以及专题研讨会。
我们预计将在6月初举办Python网络爬虫与数据分析的培训,感兴趣的朋友请点击文末左下角的阅读原文,填写在线表单预报名,预报名的朋友可以享受8折优惠。心动不如行动,赶快填吧!